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维度 的 研究 ， 发 现 掠夺 性 期 刊 在 费用 、 宣 传 、 审 理 及 政策 等 多 方面 都 存在 一 定 的 漏洞 与 
问题 ， 这 也 成 为 了 掠夺 性 期 刊 较为 明显 的 特征 。 
随 着 掠夺 性 期 刊 特征 不 断 地 被 发 现 与 总 结 ， 近 年 来 研究 人 员 对 掠夺 性 期 刊 的 识别 指 
标 与 方法 也 相应 地 提出 了 许多 观点 。 针 对 掠夺 性 期 刊 的 出 版 高 昂 费 用 ，Xia 中 1 通过 研究 掠 
夺 性 期 刊 的 收费 情况 ， 发 现 文章 处 理 费 (APC) 不 能 作为 区 分 期 刊 是 否 为 掠夺 性 期 刊 的 
唯一 标准 。 而 王 凌 峰 等 "通过 提出 评价 学 术 期 刊 出 版 费用 合理 水 平 的 期 刊 JPI 指数 ， 从 
版 面 费 角 度 为 精确 界定 掠夺 性 期 刊 提供 了 一 个 简便 有 效 的 客观 方法 。RuiterLopezL 等 "" 
从 期 刊 编 委 会 角度 出 发 ， 使 用 定量 的 方法 检查 了 掠夺 性 期 刊 的 编 委 会 情况 ， 发 现 其 中 大 
部 分 为 高 水 平 学 者 ， 发 文 量 中 位 数 为 43， 引 用 次 数 为 664，h 指数 为 14， 这 说 明 通 过 检 
查 编辑 部 成 员 情况 难以 识别 期 刊 是 否 具 有 掠夺 性 。 对 于 期 刊 网 站 与 用 词 方面 ，Chen L-X 
等 中 使 用 机 器 学 习 方法 从 主流 掠夺 性 期 刊 网 站 和 普通 期 刊 网 站 中 提取 出 来 网 站 文本 内 容 、 
关键 词 等 特征 , 提出 了 一 种 基于 新 模型 的 掠夺 性 期 刊 分 类 系统 。 而 Chen 等 "又 发 现 通过 
差异 评分 衡量 期 刊 之 间 特 定 词 频 的 差异 , 提高 单词 袋 模型 和 TF-IDF 算法 的 分 类 效率 ,可 
以 帮助 识别 掠夺 性 期 刊 特征 词 。 不 过 期 刊 网 站 和 词汇 使 用 上 也 可 以 进行 调整 与 修饰 ， 掠 
夺 性 期 刊 与 低 质量 期 刊 之 间 的 界限 仍然 比较 模糊 ,Yeo-The 等 “认为 区 分 掠夺 性 期 刊 和 真 
实学 术 期 刊 的 最 重要 标准 是 同行 评审 的 严格 性 , 而 且 提 交 作 者 的 动机 或 意图 也 至 关 重要 。 
和 孔 雌 蛤 等 从 学 术 出 版 合法 性 、 商 业 欺 诈 行为 、 学 术 不 端 行 为 等 6 个 维度 进行 对 比分 析 ， 
设置 了 18 个 二 级 指标 ， 对 识别 到 的 “预警 期 刊 ” 进 行 等 级 划分 。 从 这 些 动机 、 相 关 行 为 
因素 上 进行 分 析 得 出 了 更 深层 次 的 结论 ， 但 考虑 到 一 些 主观 因素 较 难 搜集 与 判断 ， 这 也 
可 能 会 影响 识别 结果 的 准确 性 。 因 此 ， 许 多 学 者 还 会 从 引文 情况 对 掠夺 性 期 刊 进 行 研究 
分 析 。Frandsen01g 追 踪 了 2013-2016 年 Scopus 中 124 种 掠夺 性 期 刊 的 引用 情况 ， 发 现 这 些 
期 刊 被 引用 了 1295 次 ， 每 本 期 刊 约 10.5 次 ， 并 认为 非 掠夺 性 文献 中 对 掠夺 性 期 刊 的 引用 
有 限 。Bo-Christer Björk 等 "从 Google Scholar 中 随机 选择 了 250 篇 在 掠夺 性 期 刊 上 发 表 
的 文章 ， 研 究 了 这 些 文章 五 年 内 的 被 引用 数据 ， 发 现 每 篇 文章 平均 被 引用 2.6 Wo B 
56% 的 文章 根本 没有 被 引用 。 
1.2 Altmetrics 指标 价值 及 相关 应 用 
虽然 传统 引文 指标 经 常 被 用 于 衡量 学 术 成 果 的 影响 力 ， 但 其 存在 着 时 间 滞 后 、 负 面 
引用 及 自 引 等 问题 ， 并 不 能 全 面 的 反映 出 学 术 成 果 的 影响 力 ””。 随 着 社交 在 线 媒 体 平台 
的 不 断 发 展 ， 科 研 交 流 日 益 网 络 化 ， 学 术 活 动 逐渐 开放 化 ， 越 来 越 多 的 科研 人 员 开 始 使 
用 在 线 学 术 网 络 平台 以 及 社交 媒体 平台 等 获取 、 传 播 学 术 资 源 ， 并 开展 学 术 交 流 。2010 
年 JPriem F Twitter 上 首先 提出 Altmetrics 这 一 概念 ""， 用 来 评估 学 术 论 文 在 社交 网 络 上 
的 影响 力 , 通过 对 学 术 论 文 等 学 术 成 果 在 网 络 中 传播 交流 的 追踪 ， 来 测度 其 社会 影响 力 。 
Altmetrics 作为 新 兴 的 研究 影响 力 指标 ， 自 提出 便 受 到 广大 学 者 的 关注 与 研究 。 现 有 文 
献 显 示 ， 关 于 Altmetrics 的 应 用 研究 多 集中 在 论文 或 期 刊 影响 力 综合 评价 中 。 例如， 在 论文 
方面 , 王 艳 波 等 提出 将 用 以 衡量 社会 影响 力 的 Altmetrics 指标 和 用 于 衡量 学 术 影 响 力 的 
传统 引文 指标 相 结 合 ， 构 造 出 更 综合 、 全 面 的 评价 学 术 论文 影响 力 的 指标 体系 。 在 期 刊 
维度 ， 王 凯利 等 2 融合 引文 分 析 和 Altmetrics 方法 ， 构 建 了 期 刊 影响 力 评 价 体系 ， 并 运用 
于 国际 图 书 情报 领域 期 刊 的 影响 力 分 析 ; EEE AEF Altmetrics 提 及 次 数 指标 ,对 
中 国 英文 科技 期 刊 社会 影响 力 进行 统计 分 析 。 上 述 研究 表明 ，Altmetrics 指标 对 论文 或 者 
期 刊 的 影响 力 综合 评估 的 有 效 性 已 得 到 初步 验证 。 
1.3 使 用 Altmetrics 指标 进行 掠夺 性 期 刊 识别 
尽管 使 用 Altmetrics 指标 来 识别 掠夺 性 期 刊 的 研究 较 少 , 但 初步 研究 表明 其 具有 应 用 
潜力 ， 笔 者 在 之 前 的 研究 中 曾 分 析 过 图 书 情报 领域 中 掠夺 性 期 刊 与 非 掠 夺 性 期 刊 在 
Altmetrics 上 的 表现 ， 发 现在 图 书 情报 领域 中 ， 掠 夺 性 期 刊 的 Altmetrics 存在 率 比 非 掠夺 
性 期 刊 的 低 很 多 ”。 但 因 掠夺 性 期 刊 数据 量 的 限制 , 未 能 明确 得 出 Altmetrics 可 以 有 效 识 
别 掠夺 性 期 刊 指标 的 结论 ， 其 效用 还 有 待 大 样本 系统 研究 验证 。 基 于 上 述 情况 ， 本 文 在 
已 有 研究 的 基础 上 ， 选 取 掠 夺 性 期 刊 分 布 广泛 的 生物 医学 领域 开展 研究 ， 在 传统 基于 引 
文 指标 识别 掠夺 性 期 刊 的 基础 上 引入 了 Altmetrics 指标 ， 采 用 Logit 回归 模型 构建 了 掠夺 


性 期 刊 的 判别 模型 ， 为 掠夺 性 期 刊 的 识别 提供 新 的 指标 和 方法 。 
2 研究 设计 
2. 1 研究 假设 
基于 前 文 对 期 刊 掠夺 性 和 Altmetrics 指标 及 被 引 指 标的 文献 综述 和 分 析 , 本 研究 构建 
以 下 两 个 假设 ， 并 拟 利用 Logit 回归 模型 , 以 期 刊 的 被 引 指 标 和 Altmetrics 指标 值 为 自 变 
量 , 期 刊 掠夺 性 作为 因 变 量 , 验证 这 两 个 假设 。 
假设 1: 被 引 指标 与 期 刊 掠夺 性 具有 人 负 相 关 关 系 , 即 被 引 平 均 指 标 越 高 时 , 期 刊 被 判 
定 为 掠夺 性 的 概率 越 小 。 
假设 2:Altmetrics 指标 与 期 刊 掠 夺 性 也 具有 负 相 关 关 系 , 即 Altmetrics 指标 越 高 时 , 期 二 
被 判定 为 掠夺 性 的 概率 越 小 。 
2.2 研 究 方法 
Logit 模型 ， 也 被 称 为 “评定 模型 ”或 “分 类 评定 模型 >， 是 离散 选择 法 模型 的 一 种 ， 
于 预测 事件 发 生 的 概率 ， 主 要 分 为 二 元 Logit 回归 模型 和 多 元 Logit 回归 模型 两 类 。 二 
元 Logit 回归 模型 的 因 变 量 为 分 类 ， 常 定义 事件 发 生 为 “1”， 未 发 生 为 “0”。 多 元 
Logit 回归 模型 适用 于 因 变 量 有 多 个 类 别 的 情况 。Logit 模型 广泛 应 用 于 社会 学 、 生 物 统 
计 学 、 计 量 经 济 学 等 领域 中 。 在 图 情 领域 中 ， 任 海 芝 等 ”使 用 多 元 Logit 回归 模型 对 图 
书 出 版 企业 官 微 传播 力 的 影响 因素 进行 了 实证 分 析 。 本 研究 主要 探讨 掠夺 性 期 刊 的 识别 
问题 ， 而 二 元 Logit 模型 能 够 很 好 的 刻画 “掠夺 性 期 刊 ” 及 “ 非 掠 夺 性 期 刊 ” 这 两 种 类 
型 ， 由 于 本 文 假设 被 引 指标 和 Altmetrics 指标 存在 负 相 关 关 系 ， 因 此 选择 使 用 二 元 Logit 
模型 进行 期 刊 类 型 的 识别 分 析 。 
Logit 模型 是 由 传统 线性 回归 模型 衍生 而 来 ， 在 多 元 线性 回归 模型 中 y = ao 十 
Y ox; + eF y 的 取 值 范 围 是 (一 ,+ %)， 而 事件 是 否 发 生 概率 范围 为 [0, 1] 。 因 此 ， 需 
要 对 线性 回归 模型 进行 Logit 变换 。 首 先 ， 引 入 发 生 比 Odds, Odds 表示 事件 发 生 概率 和 
事件 不 发 生 概率 的 比值 ,Odds 的 计算 方法 如 式 1 所 示 , 此 时 Odds 的 取 值 范围 是 [0, + oo). 


Probabilit o event P 
Odds — babi iit — Bf- eteri D 
Probability of no event 1-P 


C1) 


— 


dH 


其 中 ，p 表示 事件 发 生 的 概率 。 

将 发 生 比 Odds 取 De Lu ee m 
而 可 以 进行 多 元 线性 回归 建 模 。 从 概率 P 到 Odds 再 到 Logit 的 过 程 ， 称 为 Logit 变化 ， 见 
式 2: 


y= logit(P) = In (Odds) = In (es) =Q0+D ox+e (2) 

其 中 ，p alee UA, XNA, QA ABRAM, a AE 
8 表示 误差 项 。 
2. 3 变量 定义 及 数据 获取 
2.3.1 因 变 量 定义 及 数据 来 源 

本 研究 中 采用 期 刊 类 型 二 分 类 离散 变量 作为 因 变量 ， 并 定义 掠夺 性 期 刊 =1， 非 掠夺 
性 期 刊 =0。Shen 和 BijorkP25 研 究 中 发 现 ,掠夺 性 期 刊 的 文章 数量 逐年 迅速 增加 ,从 2010 年 
的 53,000 多 篇 上 升 至 2014 年 420,000 多 篇 ， 活 跃 掠夺 性 期 刊 约 8000 本 ， 这 些 掠夺 性 期 
刊 文 章 绝 大 多 数 来 自 于 生物 医学 等 领域 。 因此 ， 本 研究 从 生物 医学 领域 随机 抽取 掠夺 性 
期 刊 和 非 掠 夺 性 期 刊 各 100 本 作为 研究 样本 。 掠 夺 性 期 刊 数据 来 源 于 Kscien's 列表 ， 非 
掠夺 性 期 刊 数据 来 源 于 DOA 目录 。DOAJ 是 由 瑞典 隆 德 大 学 图 书馆 创建 和 维护 的 收录 经 
同行 评议 的 开放 存 取 COA) 期 刊 目 录 网 站 ， 具 有 严格 的 期 刊 收 录 标 准 和 期 刊 评估 流程 ” 。 
由 于 Kscien’s 列表 与 DOAJ 均 为 开放 获取 期 刊 ， 因 此 本 文 抽取 的 两 类 期 刊 样本 具有 可 比 
性 。 
2.3.2 自 变 量 定义 及 数据 来 源 


TI 
E 


被 引 次 数 在 一 定 程度 上 反映 了 文章 或 者 期 刊 的 学 术 影 响 力 ， 是 评价 论文 质量 和 价值 
的 重要 指标 ， 也 是 计算 期 刊 影响 因子 的 核心 指标 。 为 消除 期 刊 文章 数量 差异 对 被 引 量 的 
影响 ， 本 文 使 用 期 刊 平均 被 引 数 来 衡量 被 引 情况 ， 并 用 变量 x = HN. HHT 
站 收集 到 2012-2022 年 期 刊 所 发 表 的 文章 数量 ， 并 使 用 Web of Science 查询 该 期 间 的 期 刊 
被 引 数 量 。 有 具体 计算 公式 如 式 3: 


HIVELSE JA a _ 期 刊 文章 被 引 总 数 


Altmetrics 作为 衡量 学 术 成 果 的 社会 影响 力 的 新 指标 ， 拓 展 了 基于 引文 的 传统 影响 力 
评估 ， 能 更 加 全 面 地 反映 学 术 成 果 在 数字 网 络 中 的 影响 。 自 Altmetrics 概念 提出 后 ， 涌 现 
出 多 种 测量 工具 ， 如 Altmetric.com, PlumX 和 Crossref Event Data(CED) 等 。 其 中 
Altmetric.com 信息 源 广泛 ,已 涵盖 全 球 5000 1.5 万 个 学 术 及 非 学 术 博客 四 ， 
向 研究 人 员 提 供 免费 使 用 的 机 会 ， 因 此 ， 近 年 来 大 多 数 Altmetrics 的 相关 研究 采用 了 
Altmetric.com 工具 。 本 研究 通过 Altmetric. com 的 Altmetric Explorer 工具 ,使 用 期 刊 ISSN 
EAR RAE, FEAL 2012-2022 年 期 刊 的 Altmetrics 数据 。 为 消除 期 刊 规模 差异 影响 ， 本 
文 定义 Altmetrics 存在 率 指标 ， 并 用 自 变 量 x ”5 表示 ， 具 体 计算 公式 如 式 4: 


Lc 3 存在 Altmetrics 得 分 的 文章 数 
Altmetrics 存在 率 (x 2) = 二 (4) 
3 实证 分 析 


3.1 描述 性 统计 

从 收集 的 200 本 掠夺 性 期 刊 及 非 掠 夺 性 期 刊 的 Altmetrics 存在 率 和 平均 被 引 数 的 描述 
性 统计 量 〈 表 1) 可 以 观察 到 ， 这 些 掠夺 性 期 刊 的 Altmetrics 存在 率 平均 值 仅 为 0.0088， 
在 这 100 本 期 刊 中 ， 有 81 本 的 Altmetrics 存在 率 都 为 0， 即 81% 掠 夺 性 期 刊 的 文章 没有 
Altmetrics 分 数 ， 这 表明 了 掠夺 性 期 刊 文章 较 少 受到 社交 媒体 的 关注 与 讨论 。 这 些 掠夺 性 
期 刊 的 平均 被 引 数 均值 为 0.7210， 即 平均 每 篇 文章 被 引用 约 0.7210 次 。 

相 比 掠夺 性 期 刊 ， 非 掠夺 性 期 刊 的 Altmetrics 存在 率 平 均 为 0.338， 远大 于 掠夺 性 期 刊 
的 0.0088。 这 表明 了 非 掠 夺 性 期 刊 在 社交 网 络 上 的 影响 力 远大 于 掠夺 性 期 刊 。 对 于 非 掠 
夺 性 期 刊 , DUE 23 本 期 刊 的 Altmetrics 存在 率 为 0， 并 且 Altmetrics 存在 率 最 高 的 期 刊 能 够 
达到 0.9916, 表明 与 掠夺 性 期 刊 相 比 ， 非 掠夺 性 期 刊 在 社 交 网 络 上 受 关注 程度 和 影 向 力 更 
大 。 在 期 刊 被 引 方面 ， 非 掠夺 性 期 刊 平均 被 引 数 的 均值 为 $.1763， 高 于 掠夺 性 期 刊 。 侧 面 
反应 了 掠夺 性 期 刊 文章 的 质量 难以 保证 ， 未 必 能 提供 建设 性 观点 ， 较 少 被 引用 ， 而 非 掠 夺 


i 
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性 期 刊 的 文章 质量 可 能 更 高 ， 对 科研 人 员 的 研究 更 有 实质 的 帮助 ， 所 以 被 引用 频次 更 多 。 
表 1 掠夺 性 期 刊 及 非 掠 夺 性 期 刊 数据 描述 性 统计 分 析 

变量 期 刊 类 型 最 小 值 最 大 值 平均 数 标准 差 

5 掠夺 性 期 刊 0.000 0.2312 0.0088 0.0337 

Altmetrics 存在 率 — 非 掠夺 性 期 刊 0.000 0.9916 03357 03264 

ites 掠夺 性 期 刊 0.000 12.6412 0.7210 1.7353 

平均 被 引 数 非 掠 夺 性 期 刊 0.000 22.0481 5.1763 5.6598 


3.2 基于 Logit 模型 的 实证 分 析 结 果 
由 上 述 分 析 可 得 , 平均 被 引 数 和 Altmetrics 存在 率 在 掠夺 性 期 刊 和 非 掠 夺 性 期 刊 上 存 
在 着 较 大 差异 ， 那 我 们 是 否 可 以 把 它们 作为 判定 期 刊 掠 夺 性 的 指标 呢 ? 笔者 使 用 
Statal4.0 软件 ， 建 立 和 比较 了 以 下 三 个 Logit 回归 模型 。 首 先 基 于 引文 指标 构造 掠夺 性 期 
刊 识别 模型 (模型 1)， 然 后 探讨 使 用 Altmetrics 存在 率 构建 的 判别 模型 〈 模 型 2) 效果 ， 最 
后 结合 平均 被 引 数 和 Altmetrics 存在 率 构 建 掠夺 性 期 刊 识别 模型 (模型 3), 并 对 这 三 个 模型 
及 效果 进行 了 比较 分 析 。 具 体 模型 及 效果 分 析 如 下 。 
3.2.1 仅 针对 引文 指标 的 判别 模型 〈 模 型 1) 分 析 结 果 

通过 使 用 Statal4.o 软件 对 期 刊 的 平均 被 引 数 进行 Logit 模型 回归 分 析 ， 得 出 结果 如 表 


ines 


2 Pras Logit 模型 拟 合 结果 的 表达 式 为 y= In 和) = 0.864 — 0.438x 1。 可 以 看 出 ， 
平均 被 引 数 变量 系数 为 -0.438<0 (sig<0.05), es ni 刊 是 否 为 掠夺 性 期 
刊 显 显著 负 相 关 ， 说 明 假 设 1 成立 ， 即 当 平 均 被 引 数 较 低 时 ， 期 刊 为 掠夺 性 期 刊 的 概率 
更 大 。 
表 2 针对 引文 指标 Logit 模型 回归 结果 
变量 名 称 系数 Z 值 Sig 
常数 项 0.864 4.46 0.000 
平均 被 引 数 -0.438 -5.13 0.000 
在 对 模型 参数 计算 完成 后 ， 需 要 对 模型 计算 出 的 预期 概率 和 实际 概率 是 否 能 够 有 交 
的 拟 合 做 出 评价 。 如 果实 际 观测 值 能 够 与 模型 预测 值 有 着 较 高 的 一 致 性 ， 则 认为 该 模型 
能 够 拟 合 数据 ;反之 ， 则 不 能 接受 该 模型 ， 需 要 重新 设置 模型 的 变量 。 在 本 研究 中 笔者 


采用 Hosmer-Lemeshow 检验 对 二 元 Logit 回归 模型 的 拟 合 优 度 进 行 检验 。 
Hosmer-Lemeshow 检验 表示 拟 合 值 和 观测 值 的 吻合 程度 。 如 Sig<0.05， 表 明 模 型 
值 与 观测 值 存 在 显著 差异 ， 评 分 模型 工作 效果 欠 佳 ， 反之，Sig>0.05 则 认为 在 可 接受 
水 平 上 模型 的 估计 拟 合 了 数据 ， 表 明 评 分 模型 工作 效果 良好 。 对 引文 指标 的 判别 模型 
进行 Hosmer-Lemeshow 检验 ， 得 出 检验 的 Sig 值 为 0.000<0.05， 这 一 结果 说 明了 仅 依 据 平 
均 被 引 量 建立 的 Logit 判别 模型 的 拟 合 结果 欠缺 ， 为 此 我 们 尝试 引入 Altmetries 指标 进行 判 


ri 


别 分 析 。 
3.2.2 仅 针 对 Altmetrics 的 判别 模型 (模型 2) 分 析 结 果 
首先 ， 仅 对 期 刊 的 Altmetrics 存在 率 进行 Logit 判别 模型 建立 ， 得 到 Logit 模型 拟 合 表 
达 式 为 y= ln (s) = 1.036 —14.871x >，, 建 模 结果 如 表 3 所 示 。 可 以 看 出 Altmetrics 
存在 率 的 系数 为 -14.871<0 (sig<0.05)， 表 明了 期 刊 的 Altmetrics 存在 率 对 期 刊 是 否 是 掠夺 
性 期 刊 星 显著 负 相 关 ， 说 明 假设 2 成立， 即 期 刊 的 Altmetrics 存在 率 越 高 ， 期 刊 为 掠夺 性 
期 刊 的 概率 越 小 。Altmetrics 存在 率 能 够 反映 出 一 本 期 刊 学 术 成 果 的 社会 影响 力 ， 因 此 这 
一 结果 也 是 合理 的 。 该 部 分 继续 使 用 Hosmer-Lemeshow 检验 来 对 模型 拟 合 程 度 进行 检验 ， 
得 出 使 用 Altmetrics 存在 率 建立 的 判别 模型 Hosmer-Lemeshow 检验 的 Sig 值 为 0.997>0.05， 
说 明了 该 模型 的 拟 合 效 果 较 好 。 
表 3 针对 引文 指标 Logit 模型 回归 


系数 Z 值 


的 预 


里 


四 
N 


结 


变量 名 称 


Sig 


常数 项 1.036 5.24 

Altmetrics 存在 率 -14.871 -4.22 
3.2.3 引入 平均 被 引 数 和 Altmetries 存在 率 的 判别 模型 (模型 3) 分 析 结 果 
除了 单独 使 用 Altmetrics 存在 率 构造 了 Logit 判别 模型 外 ， 笔 者 还 建立 了 同时 引入 平均 


0.000 
0.000 


被 引 EN Altmetrics 存在 率 变量 的 Logit 模型 回归 模型 ,Logit 模型 拟 合 结果 的 表达 式 为 y= 
In (5 pes .220—0.204x 1 一 12.015x 2, HAN UXEABPIDR. HH, WSI^E 


均 数 和 Altmetrics 存在 率 指标 的 显著 性 水 平分 别 为 0.033 n 0. 002， 均 小 于 0.05。 这 表明 拟 


合 效果 是 显著 的 ， 平 均 被 引 数 和 Altmetrics 存在 率 对 期 刊 是 否 为 掠夺 性 期 刊 具 有 人 负 问 影响 ， 
假设 1 和 假设 2 成 立 。 即 当 平 均 被 引 数 和 Altmetrics se 时 ， 期刊 为 掠夺 性 期 刊 的 概 
率 更 大 。 这 与 模型 1 和 模型 2 得 到 的 结果 也 是 相 一 致 的 。 

表 4 针对 引入 Altmetrics 模型 回归 结果 
变量 名 称 系数 Z 值 Sig 
常数 项 1.220 5.51 0.000 
平均 被 引 数 -0.204 -2.13 0.033 
Altmetrics 存在 率 -12.015 -3.15 0.002 


f 
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用 Hosmer-Lemeshow 检验 对 模型 拟 合 优 度 进行 检验 ， 得 到 结果 为 Sig=0.3568>0.05. 


Hosmer-Lemeshow 检验 当 Sig EKF 0.05 的 时 候 拟 合 效果 较 好 ， 当 Sig EKF 0.1 的 


时 候 拟 合 效果 
3.2.4 三 个 模型 


ROC 曲线 下 的 面积 来 检验 模型 预测 准确 率 的 情况 ， 
该 模型 有 足够 的 辨别 力 。 根 据 曲线 位 置 ，ROC 曲线 把 整个 图 划分 成 了 两 部 分 ， 曲 线 下 方 部 
Curve)， 用 来 表示 预测 准确 性 ，AUC 值 越 高 ， 也 就 是 


分 的 面积 被 称 为 AUC (Area Under 


J 比较 分 析 结 果 


佳 ， 说 明 引 入 Altmetrics 存在 率 后 的 判别 模型 拟 合 效果 较 好 。 


并 认为 当 曲 线 下 面积 大 于 0.75 时 ， 


线 下 方面 积 越 大 ， 说 明 预 测 准 确 率 越 高 。 曲 线 越 接近 左上 角 OX 越 小 Y 越 大 )， 预 测 准确 


率 越 高 。 本 文 使 


表 5 模型 ROC 比较 


EH ROC 分 析 来 进行 三 个 模型 的 比较 分 析 。 


渐进 95% 的 置信 区 间 


模型 AUC 面积 标准 误 m TH 

pum 1 0.8204 0.0292 0.76314 0.87766 
模型 2 0.8468 0.0260 0.3780 0.7559 
模型 3 0.8908 0.0226 0.84649 0.93511 


从 模型 ROC 结果 (ESO 可 以 看 出 ， 模 型 3 的 预测 效果 要 优 于 模型 1 和 模型 2， 即 模 
型 3 的 预测 准确 率 更 高 。 这 也 就 是 说 ， 在 判别 模型 的 构建 上 ， 同 时 融合 了 平均 引文 数 和 
Altmetrics 存在 率 的 模型 要 比 单 独 利 用 平均 引文 数 、Altmetrics 存在 率 的 模型 效果 要 好 , 单 


独 使 用 Altmetri 
证 明了 本 文 提 
4 模型 验证 


cs 存在 率 构造 的 判别 模型 又 比 单独 使 用 平均 引文 数 的 模型 效果 更 好 , 进而 
出 引入 Altmetrics 指标 进行 掠夺 性 期 刊 判 别 的 合理 性 和 正确 性 。 


为 了 对 模型 效果 进行 验证 ， 笔 者 | 


NS 了 在 近 一 年 内 所 收 到 的 邀请 投稿 邮件 中 的 期 刊 


数据 。Sureda - Negre 等 ”在 对 西班牙 一 所 大 学 教育 领域 的 三 位 教授 在 3 个 月 内 收 到 邀请 


在 期 刊 上 发 表 文章 的 电子 邮件 中 的 期 刊 进行 分 析 发 现 ， 大 多 数 的 期 刊 (69.7%) 在 掠夺 性 


期 刊 名 单 并 认为 通过 邮箱 向 学 者 发 送 投稿 邀 请 的 期 刊 大 部 分 质量 不 高 。 因 此 ， 我 们 


认为 选择 邮箱 中 的 邀请 发 文 期 刊 进行 判别 模型 效果 验证 是 合 到 


list 中 出 现 的 期 刊 后 ， 得 到 期 刊 如 表 6 所 示 。 


表 6 邀请 投稿 邮件 


中 的 期 刊 信息 


的 ， 在 剔除 了 在 Kscien's 


期 刊 名 称 期 刊 网 址 ISSN Online 
Review of Contemporary Business Research http://rcbrnet.com/ 2333-6420 
American Journ 2 | of Information Science and http://www.amjist.org/cggh 2640-0588 
Technology (AJIST) 6j/zi8vz 
Journal of Intercultural Communication (JICC) https://immi.se/intercultural 1404-1634 
Journal of Management Information System and http://jmisenet.com/ 2373-7638 
E-commerce 
International Journal of Business & Economic https://ijbed.org/ 2692-5583 
Development 
International Journal of Business and Applied www.ijbassnet.com 2469-6501 
Social Science 
International Journal of Library and Information https://www.ijlis.org/ 2231-4911 
Studies 
Journal of Economics & Management Research — http:;//dspace.lu.lv/dspace/ha — 2755-0214 
ndle/7/2553 
International Journ a | of Sustainability http://www.ijosmit.com/se4 2575-5110 
Management and Information Technologies bqw/j7IeA 
Health Informatics Journal https://journals.sagepub.co 1741-2811 
m/home/JHI 
International Journal of Business and Social www.ijbssrnet.com 2709-2143 


Science Research 


International Journal of Sustainability https://www.sciencepublishi 2575-5110 


Management and Information Technologies nggroup.com/j/ijsmit 
Journal of Business and Social Science Review jbssrnet.com 2690-0874 
(JBSSR) 
International Journal of Business & Management https://ijbms.net/ 2694-1449 


Studies (IJBMS) 

使 用 相同 的 数据 收集 方法 对 这 些 期 刊 的 引文 数据 和 Altmetrics 数据 进行 收集 ,并 将 其 
带 入 模型 3 中 进行 验证 ， 最 终 得 到 结果 如 表 7 所 示 ， 可 以 看 到 在 这 14 本 验证 期 刊 中 仅 有 
1 本 期 刊 Health Informatics Journal 为 掠夺 性 期 刊 的 预测 概率 为 0.003<0.5, 笔者 查阅 后 发 现 ， 
期 刊 Health Informatics Journal 为 SCI 期刊，JCR 分 区 为 Q3 区 ， 这 同 我 们 所 预测 的 该 期 刊 
为 掠夺 性 期 刊 的 概率 是 相 匹配 的 。 除 此 之 外 余下 13 本 的 预测 概率 大 于 0.5, 12 本 预测 概率 
KF 0.7,， 这 说 明了 这 些 期 刊 虽然 还 没有 出 现在 Kscien 掠夺 性 期 刊 的 列表 中 ,但 它们 为 掠 
夺 性 期 刊 的 概率 较 高 , 这 也 和 Sureda - Negre 等 ”提出 的 通过 邮箱 向 学 者 发 送 投 稿 洲 请 的 
期 刊 质量 不 高 的 观点 相符 合 。 也 表明 了 融合 了 平均 引文 数 和 Altmetrics 存在 率 的 掠夺 性 期 
刊 判别 模型 是 合理 的 。 
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AT 模型 验证 结果 


期 刊 名 称 Altmetrics FÆR ”平均 被 引 数 ”预测 概率 
Review of Contemporary Business Research 0.0000 0.5870 0.7504 
American Journ a | of Information Science and 0.0000 0.0000 0.7721 
Technology (AJIST) 
Journal of Intercultural Communication (JICC) 0.0714 1.3524 0.5215 
Journal of Management Information System and 0.0000 0.4583 0.7552 
E-commerce 
International Journal of Business & Economic 0.0000 0.1289 0.7675 
Development 
International Journal of Business and Applied 0.0000 0.0841 0.7691 
Social Science 
International Journal of Library and Information 0.0000 0.1117 0.7681 
Studies 
Journal of Economics & Management Research 0.0000 0.0337 0.7709 
International Journ a | of Sustainability 0.0000 0.0000 0.7721 
Management and Information Technologies 
Health Informatics Journal 0.6297 9.1725 0.0003 
International Journal of Business and Social 0.0000 0.1304 0.7674 
Science Research 
International Journal of Sustainability 0.0000 0.5111 0.7533 
Management and Information Technologies 
Journal of Business and Social Science Review 0.0000 0.0168 0.7715 
(JBSSR) 
International Journal of Business & 0.0000 0.1282 0.7675 


Management Studies (IJBMS) 
5 讨论 和 结论 

本 文 基于 Logit 回归 模型 ， 分 别 构建 了 仅 含 期 刊 的 平均 被 引 量 ， 仅 含 Altmetrics 存在 
率 指标 , 以 及 同时 包含 期 刊 的 平均 被 引 量 和 Altmetrics 存在 率 指标 的 掠夺 性 期 刊 判别 模型 。 
通过 模型 比较 分 析 后 发 现 , 仅 含 Altmetrics 存在 率 指 标 与 同时 引入 平均 被 引 量 和 Altmetrics 
存在 率 的 掠夺 性 期 刊 判别 模型 效果 较 优 。 虽 然 传 统 认 为 期 刊 的 引文 指标 对 于 期 刊 学 术 影 
响 力 的 衡量 较为 适用 ， 但 Oviedo-Garcia 对 掠夺 性 期 刊 出 版 商 MDPI 的 分 析 显 示 ， 某 些 掠 
夺 性 期 刊 存在 较 高 的 自 引 率 ” ， 导 致 部 分 掠夺 性 期 刊 有 着 较 高 的 被 引 量 。 这 说 明 ， 这 些 
期 刊 的 高 被 引 量 存在 被 操纵 的 可 能 ， 纯 粹 以 引文 指标 来 判断 期 刊 是 否 为 掠夺 性 期 刊 并 不 


准确 。 在 Web2.0 环境 下 , Altmetrics 指标 充分 利用 了 学 术 社 交 网 络 进行 文献 计量 ，Altmetrics 
指标 因为 数据 更 新 更 加 及 时 ， 进 而 能 够 避免 学 术 成 果 影 响 力 评估 的 滞后 性 ， 并 可 以 补充 
性 地 反映 学 术 成 果 的 社会 影响 力 。Altmetrics 指标 和 引文 指标 共同 应 用 , 可 以 更 全 面 地 评估 
学 术 成 果 的 影响 力 。 在 本 研究 中 ， 同 时 引入 平均 被 引 量 和 Altmetrics 指标 构建 的 判别 模型 ， 
综合 了 两 类 指标 的 优势 ， 因 此 对 判断 期 刊 的 掠夺 性 具有 更 好 的 效果 。 
在 此 基础 上 ， 笔 者 收集 了 邮箱 中 投稿 邀请 邮件 的 期 刊 数据 ， 将 其 带 入 同时 引入 平均 
被 引 量 和 Altmetrics 存在 率 的 掠夺 性 期 刊 判别 模型 ， 对 该 模型 进行 验证 。 结 果 表 明 ， 邮 箱 
邀请 投稿 的 期 刊 很 大 概率 上 为 掠夺 性 期 刊 。 这 表明 了 Altmetrics 指标 在 识别 掠夺 性 期 刊 方 
面具 有 良好 的 效果 ， 可 以 较 好 地 判断 期 刊 的 良 劣 ， 为 掠夺 性 期 刊 的 识别 提供 新 的 指标 和 

不 可 否认 的 是 ， 本 研究 仍然 存在 一 些 局 限 性 。 首 先 ， 由 于 数据 获取 困难 ， 我 们 仅 能 
初步 验证 使 用 期 刊 被 引 指标 和 Altmetrics 指标 识别 掠夺 性 期 刊 的 有 效 性 ， 其 次 ， 文 章 中 应 
用 的 方法 还 有 待 优化 。 在 未 来 的 研究 中 ， 我 们 将 尝试 从 以 下 两 个 方面 进行 改进 : 一 是 扩大 
指标 类 型 ， 加 入 更 多 能 够 有 效 识别 掠夺 性 期 刊 的 指标 ， 以 丰富 模型 输出 ; 二 是 增加 样本 
量 ， 并 尝试 采用 更 为 前 沿 的 方法 ， 如 机 器 学 习 中 的 随机 森林 模型 ， 以 提升 识别 效果 和 模 
型 精度 。 总 体 而 言 ， 本 研究 对 于 掠夺 性 期 刊 的 识别 具有 一 定 启发 意义 ， 但 仍 需 在 数据 和 
方法 上 做 进一步 拓展 。 
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A study of predatory journal identification using Altmetrics metrics 


Abstract: 


[Purposes] This article explores the effect of introducing the Altmetrics index into the 
identification of predatory journals, in order to provide a new perspectives for the identification of 
predatory journals. 

[Methods] Based on the logit regression model, three models for the identification of predatory 
journals were constructed using the average number of citations alone, the presence rate of 
altmetrics alone, and a combination of both indicators. The ROC curve was used to compare and 
analyze the fitting effects of the three models. Finally, journal data in invitation emails were used 
to validate the model effects. 

[Findings]The model integrating both average citations and Altmetrics existence rate performed 
the best for identifying predatory journals. with both indicators showing significant negative 
correlation with journal predatoriness. Validation using the data from 14 journals that sent out 
solicitation emails showed that over 8596 of them were identified as predatory journals by the 
model, demonstrating the rationality of the model. 

[Conclusions] The application of the Altmetrics metric has shown good results and provides 


valuable new perspectives in the identification of the predatory journals. 
Key words: Predatory journals; Altmetrics; Citation analysis; Identification studies 
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